4.2.5 Max Tokens 설정을 통한 응답 길이의 물리적 제한과 일관성